Une approche probabiliste pour le classement d'objets incomplètement connus dans un arbre de décision. (A Probabilistic Approach to Classify Incomplete Objects in a Decision Tree)

نویسنده

  • Lamis Hawarah
چکیده

We describe in this thesis an approach to fill missing values in decision trees during theclassification phase. This approach is derived from the ordered attribute trees (OAT) method,proposed by Lobo and Numao in 2000, which builds a decision tree for each attribute and usesthese trees to fill the missing attribute values. It is based on the Mutual Information between theattributes and the class. Our approach extends this method by taking the dependence betweenthe attributes into account when constructing the attributes trees, and provides a probabilitydistribution as a result when classifying an incomplete object (instead of the most probableclass). We present our approach and we test it on some real databases. We also compare ourresults with those given by the C4.5 method and OAT.We also propose a k-nearest neighbours algorithm which calculates for each object from thetest data its frequency in the learning data. We compare these frequencies with the classificationresults given by our approach, C4.5 and OAT. Finally, we calculate the complexity of construct-ing the attribute trees and the complexity of classifying a new instance with missing values usingour classification algorithm, C4.5 and OAT.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Classement d'objets incomplets dans un arbre de décision probabiliste

Résumé. Nous présentons une approche probabiliste pour déterminer les valeurs manquantes des objets incomplets pendant leur classement dans les arbres de décision. Cette approche est dérivée de la méthode d’apprentissage supervisé appelée Arbres d’Attributs Ordonnés proposée par Lobo et Numao en 2000, qui construit un arbre de décision pour chacun des attributs, selon un ordre croissant en fonc...

متن کامل

Un critère d'évaluation Bayésienne pour la construction d'arbre de décision

Résumé. Nous présentons dans cet article un nouvel algorithme automatique pour l’apprentissage d’arbres de décision. Nous abordons le problème selon une approche Bayésienne en proposant, sans aucun paramètre, une expression analytique de la probabilité d’un arbre connaissant les données. Nous transformons le problème de construction de l’arbre en un problème d’optimisation : nous recherchons da...

متن کامل

A Model for Probabilistic Reasoning on Assume/Guarantee Contracts

In this paper, we present a probabilistic adaptation of an Assume/Guarantee contract formalism. For the sake of generality, we assume that the extended state machines used in the contracts and implementations define sets of runs on a given set of variables, that compose by intersection over the common variables. In order to enable probabilistic reasoning, we consider that the contracts dictate ...

متن کامل

Une approche de choix résolu au sens de Jaffray dans les arbres de décision munis de probabilités imprécises

Résumé : Dans cet article, nous nous intéressons à l’optimisation du critère d’Hurwicz dans un arbre de décision muni de probabilités imprécises. Nous proposons une procédure de choix résolu au sens de Jaffray [5] afin de déterminer une stratégie dont toutes les sous-stratégies sont à la fois proches de l’optimum (au sens d’Hurwicz) et E-admissible (c’est-à-dire qu’il existe un jeu de probabili...

متن کامل

Choix d'une mesure de proximité discriminante dans un contexte topologique

Résumé. Les résultats de toute opération de classification ou de classement d’objets dépendent fortement de la mesure de proximité choisie. L’utilisateur est amené à choisir une mesure parmi les nombreuses mesures de proximité existantes. Or, selon la notion d’équivalence topologique choisie, certaines sont plus ou moins équivalentes. Dans cet article, nous proposons une nouvelle approche de co...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2008